Analiza ofert wynajmu nieruchomości z portalu gumtree.pl


Krzysztof Słomczyński

9 grudnia 2016

Inspiracja

  • Praktyczny wymiar projektu
  • Aplikacja bazująca na modelu przewidującym ceny

Struktura danych

Jedna zmienna objaśniająca

Przed - 13 tysięcy ofert, po - 10 tysięcy

Wiele zmiennych objaśniających

Przed - 39 zmiennych niezależnych, po - 26

Metoda Liczba modeli p=30 K=10 n=100 Najmniejszy błąd
Best Subset Regression 2p 1012 490
Forward Stepwise Selection p22 760 490
Backward Stepwise Selection p22 760 490
Walidacja p22 760 506
Kroswalidacja K p22 7605 493
Ridge Regression K nλ 1000 493
Lasso K nλ 1000 492

Napotkane problemy

  • Wyrafinowana analiza treści opisu
  • Propozycja dokładnego opisu atrybutów w formularzu na gumtree.pl

Przygotowanie do projektu

Ukończenie kursów:

  • Machine Learning at Coursera by Andrew Ng (18 godzin)
  • Statistical Learning at Stanford ONLINE by Trevor Hastie and Robert Tibshirani (15 godzin)

Zapoznanie się z narzędziami:

Kod i inne projekty

  • Kod napisany na potrzeby tego projektu na github
  • Raport z innego projektu w którym brałem udział